热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

ML|自动编码器

ML|自动编码器原文:https://www.geeksfor

ML |自动编码器

原文:https://www.geeksforgeeks.org/ml-auto-encoders/

神经网络的一个典型应用是监督学习。它包括训练数据包含一个输出标签。神经网络试图学习从给定输入到给定输出标签的映射。但是如果输出标签被输入向量本身代替了呢?然后网络将尝试找到从输入到自身的映射。这将是一个平凡映射的恒等式。

但如果不允许网络简单复制输入,那么网络将被迫只捕捉显著特征。这种限制为未知的神经网络开辟了一个不同的应用领域。主要应用是降维和特定数据压缩。

首先在给定的输入上训练网络。该网络试图从它拾取的特征中重构给定的输入,并给出作为输出的输入的近似值。训练步骤包括误差的计算和误差的反向传播。自动编码器的典型架构类似于瓶颈。

自动编码器的示意结构如下:

网络的编码器部分用于编码,有时甚至用于数据压缩目的,尽管与其他通用压缩技术如 JPEG 相比,它不是很有效。编码是通过网络的编码器部分实现的,该部分在每一层中具有数量逐渐减少的隐藏单元。因此,这一部分被迫只提取数据中最重要和最具代表性的特征。网络的后半部分执行解码功能。该部分在每一层中具有越来越多的隐藏单元,因此试图从编码数据中重建原始输入。****

因此,自动编码器是一种无监督学习技术。

*训练用于数据压缩的自动编码器:*对于数据压缩过程,压缩最重要的方面是压缩数据重建的可靠性。这一要求决定了自动编码器的结构是一个瓶颈。

*第一步:对输入数据进行编码*

自动编码器首先尝试使用初始化的权重和偏差对数据进行编码。

*第二步:解码输入数据*

自动编码器试图从编码数据中重建原始输入,以测试编码的可靠性。

*步骤 3:反向传播错误*

在重建之后,计算损失函数以确定编码的可靠性。产生的错误被反向传播。

多次重复上述训练过程,直到达到可接受的重建水平。

在训练过程之后,仅保留自动编码器的编码器部分,以对训练过程中使用的类似类型的数据进行编码。

约束网络的不同方法如下


  • *保持较小的隐藏层:*如果每个隐藏层的大小保持尽可能小,那么网络将被迫只拾取数据的代表性特征,从而对数据进行编码。

  • *正则化:*在该方法中,将损失项添加到成本函数中,这鼓励网络以不同于复制输入的方式进行训练。

  • *去噪:*约束网络的另一种方法是向输入添加噪声,并教网络如何从数据中去除噪声。

  • *调整激活函数:*该方法涉及改变各个节点的激活函数,使得大部分节点处于休眠状态,从而有效减小隐藏层的大小。

自动编码器的不同变体是:-


  • *去噪自动编码器:*这种类型的自动编码器在部分损坏的输入上工作,并训练以恢复原始的未失真图像。如上所述,这种方法是限制网络简单复制输入的有效方法。

  • *稀疏自动编码器:*这种类型的自动编码器通常包含比输入更多的隐藏单元,但一次只允许有几个处于活动状态。这种特性被称为网络的稀疏性。网络的稀疏性可以通过手动调零所需的隐藏单元、调整激活函数或在成本函数中添加损失项来控制。

  • *变分自动编码器:*这种类型的自动编码器对潜在变量的分布做出强假设,并在训练过程中使用随机梯度变分贝叶斯估计器。它假设数据是由定向图形模型生成的,并试图学习条件属性q_{\theta}(z|x)的近似q_{\phi}(z|x),其中\phi\theta分别是编码器和解码器的参数。


推荐阅读
  • 吴石访谈:腾讯安全科恩实验室如何引领物联网安全研究
    腾讯安全科恩实验室曾两次成功破解特斯拉自动驾驶系统,并远程控制汽车,展示了其在汽车安全领域的强大实力。近日,该实验室负责人吴石接受了InfoQ的专访,详细介绍了团队未来的重点方向——物联网安全。 ... [详细]
  • 七大策略降低云上MySQL成本
    在全球经济放缓和通胀压力下,降低云环境中MySQL数据库的运行成本成为企业关注的重点。本文提供了一系列实用技巧,旨在帮助企业有效控制成本,同时保持高效运作。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 深入解析WebP图片格式及其应用
    随着互联网技术的发展,无论是PC端还是移动端,图片数据流量占据了很大比重。尤其在高分辨率屏幕普及的背景下,如何在保证图片质量的同时减少文件大小,成为了亟待解决的问题。本文将详细介绍Google推出的WebP图片格式,探讨其在实际项目中的应用及优化策略。 ... [详细]
  • 【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库
    【小白学习C++ 教程】二十三、如何安装和使用 C++ 标准库 ... [详细]
  • 深入解析:存储技术的演变与发展
    本文探讨了从单机文件系统到分布式文件系统的存储技术发展过程,详细解释了各种存储模型及其特点。 ... [详细]
  • 在 Ubuntu 22.04 LTS 上部署 Jira 敏捷项目管理工具
    Jira 敏捷项目管理工具专为软件开发团队设计,旨在以高效、有序的方式管理项目、问题和任务。该工具提供了灵活且可定制的工作流程,能够根据项目需求进行调整。本文将详细介绍如何在 Ubuntu 22.04 LTS 上安装和配置 Jira。 ... [详细]
  • 如题:2017年10月分析:还记得在没有智能手机的年代大概就是12年前吧,手机上都会有WAP浏览器。当时没接触网络原理,也不 ... [详细]
  • Redis:缓存与内存数据库详解
    本文介绍了数据库的基本分类,重点探讨了关系型与非关系型数据库的区别,并详细解析了Redis作为非关系型数据库的特点、工作模式、优点及持久化机制。 ... [详细]
  • Vue 实战经验与常见问题总结
    本文总结了 Vue 开发中的一些常见问题和解决方案,包括全局组件的注册、头像显示、背景图路径问题以及 Sass 公用样式的使用方法。 ... [详细]
  • 本文详细介绍了在Mac平台上安装和配置MySQL的步骤,包括下载安装包、卸载MySQL以及解决命令行中找不到mysql命令的问题。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 近期的研究和探讨表明,人类意识的核心在于其方向性和目标导向性,而现有的现代神经网络技术尚无法完全模拟或创造这种意识。尽管如此,通过不断优化神经网络架构和算法,我们可以在特定任务中实现更高水平的智能化创新,从而推动人工智能领域的进一步发展。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
author-avatar
博客百度2
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有